当前位置: 开发笔记 > 编程语言 > 正文

对话|英伟达RAPIDS深度解读：深度学习很重要，但是还不够

作者：小哥 | 来源：互联网 | 2023-09-13 12:15

智东西（公众号：zhidxcom）文|Lina

对话 | 英伟达RAPIDS深度解读：深度学习很重要，但是还不够

智东西（公众号：zhidxcom）

文 | Lina

智东西11月21日苏州报道，在英伟达GTC China的年度大会上，智东西与少数媒体一同采访了英伟达解决方案架构与工程团队副总裁Marc Hamilton，深入讲解了英伟达RAPSID开源GPU加速平台。

对话 | 英伟达RAPIDS深度解读：深度学习很重要，但是还不够

▲英伟达解决方案架构与工程团队副总裁Marc Hamilton

RAPSID发布于2018年10月10日的GTC Europe大会上，是一款针对数据科学和机器学习的GPU加速平台，它为数据科学家提供标准化的流水线式工具，数据处理速度较仅用CPU提升50倍。

一、深度学习很重要，但是还不够

在过去几年的人工智能大潮当中，深度学习（Deep Learning）成了最火热的话题之一。作为机器学习（Machine Learning）的一个分支，它几乎成为了AI的代名词，在AI安防、语音等方面大放异彩。

然而，深度学习有着它的局限性。深度学习在处理非结构化数据（比如语音、图像等）上的效果更好，而机器学习却在结构化数据处理上效果更好。

在某些相对复杂的场景里，深度学习往往不足以完成任务，需要引入其他机器学习技术。

举个例子，目前，在银行、零售店、医疗等行业中有大量结构化数据，比如个人消费经历、库存、电子病历等。越来越多的企业希望从这些数据中挖掘出价值，反向优化自己的运作流程。

然而随着数据量的不断增加，数据科学家们在处理这些信息时所需要的时间也越来越长。

在过去6年里，英伟达投入了大量的资源与精力进行深度学习的相关研发，也取得了很不错的成功。然而，对于除了深度学习之外的很多机器学习算法，GPU却不能很好地支持。

对话 | 英伟达RAPIDS深度解读：深度学习很重要，但是还不够

这张图里是一个普通英伟达数据科学家的一天，我们可以从图里看到，在不同的数据处理之间有着大量的休息时间（蓝绿色部分，一般他们用这个时间来喝杯咖啡），然而由于事情还没有做完，所以他们晚上通常还要加会班，工作效率非常低。

二、推出RAPIDS开源GPU加速平台

为了改变这一现状，在今年10月的GTC 2018欧洲站上，英伟达推出了其机器学习开源GPU加速平台——RAPIDS。

Marc Hamilton表示，数据科学家不需要大量修改自己的算法，只需要在自己现有的机器学习算法上进行少量调整——比如“加入三行代码”，就可以基于RAPIDS进行机器学习算法的加速。

对话 | 英伟达RAPIDS深度解读：深度学习很重要，但是还不够

RAPIDS平台通过加速cuDF、cuML、cuGRAPH库，英伟达能够让GPU加速计算应用到更多机器学习的算法与场景当中，为数据科学家提供标准化的流水线式工具。

比如在数据处理方面，RAPIDS将会通过数据准备、数据合并、数据降维三个步骤加速处理数据。

此外，RAPIDS开源GPU加速平台构建于Apache Arrow、pandas和scikit-learn等流行的开源项目之上，能够为最流行的 Python 语言来了GPU提速。

对话 | 英伟达RAPIDS深度解读：深度学习很重要，但是还不够

▲支持RAPIDS的企业、云服务平台等

RAPIDS目前已经被非常广泛的采用。

三、快速进行AI流感疫情爆发检测

在今天的GTC China主论坛演讲上，黄仁勋表示，RAPIDS目前已经被非常广泛的采用，比如华大基因、中国移动、平安科技等中国公司都宣布引入它进行机器学习加速。

对话 | 英伟达RAPIDS深度解读：深度学习很重要，但是还不够

华大基因用RAPIDS进行癌症基因检测、中国移动用它进行优化无线网络——这个在5G时代至关重要、平安科技则用它来模拟大型疫情爆发情况。

Marc Hamilton进一步介绍了利用RAPIDS来模拟检测流感疫情爆发情况的经过。

在流感季节，各个国家的政府卫生部门都会从医院、医生、患者处收集数据，找出疫情的传播原因与传播规律。

然而，对于中国这种人口大国来说，这项工作的一大挑战就是数据量过于庞大，如果要从中找出规律，可能要需要长达4个月的时间——这时流感季节早就结束了。

而基于英伟达RAPIDS平台，数据处理速度可以较仅用CPU提升50-100倍，这项工程可以被缩短到几天甚至几个小时的时间，快速找到疫情的传播原因与传播规律。

以上就是本文的全部内容，希望本文的内容对大家的学习或者工作能带来一定的帮助，也希望大家多多支持我们

推荐阅读

ip
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
sum
2018年人工智能大数据的爆发，学Java还是Python？

本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代，Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言，容易上手。其特色之一是强制使用空白符作为语句缩进，使得新手可以快速上手。目前，Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣，欢迎加入qq群458345782。 ... [详细]

蜡笔小新 2023-12-14 20:08:28
sum
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
ip
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
bit
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
bit
显卡驱动对游戏的影响及其提升效果的研究

本文研究了显卡驱动对游戏体验的提升效果，通过比较新旧驱动加持下的RTX 2080Ti显卡在游戏体验上的差异。测试平台选择了i9-9900K处理器和索泰RTX 2080Ti玩家力量至尊显卡，以保证数据的准确性。研究结果表明，显卡驱动的更新确实能够带来近乎50%的性能提升，对于提升游戏体验具有重要意义。 ... [详细]

蜡笔小新 2023-12-13 21:52:19
const
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
main
深入理解Kafka服务端请求队列中请求的处理

本文深入分析了Kafka服务端请求队列中请求的处理过程，详细介绍了请求的封装和放入请求队列的过程，以及处理请求的线程池的创建和容量设置。通过场景分析、图示说明和源码分析，帮助读者更好地理解Kafka服务端的工作原理。 ... [详细]

蜡笔小新 2023-12-12 16:14:59
search
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
search
腾讯BERT推理模型TurboTransformers的快速推理能力

本文介绍了腾讯最近开源的BERT推理模型TurboTransformers，该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想，通过简化问题和加速开发，实现了快速推理能力。同时，文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题，并提出了合并计算的解决方案。 ... [详细]

蜡笔小新 2023-12-12 13:48:41
ip
嵌入式处理器的架构与内核发展历程

本文主要介绍了嵌入式处理器的架构与内核发展历程，包括不同架构的指令集的变化，以及内核的流水线和结构。通过对ARM架构的分析，可以更好地理解嵌入式处理器的架构与内核的关系。 ... [详细]

蜡笔小新 2023-12-11 15:38:57
ip
技嘉秀高端B450主板：不再支持第七代APU，性价比高且兼容锐龙一代和二代

在台北电脑展上，技嘉展示了一款高端的B450主板，型号为“b450 aorus pro wi-fi”。该主板具有10+1相供电、散热片覆盖的供电区域和芯片组，以及两个m.2插槽和背部IO挡板。虽然不支持第七代APU bristol ridge，但它兼容锐龙一代和二代，且具有较高的性价比。该主板还配备了音频声卡、Wi-Fi无线网卡等功能，是一款性能出色且设计精良的主板。 ... [详细]

蜡笔小新 2023-12-11 13:00:04
ip
建立分类感知器二元模型对样本数据进行分类

本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型，使用最小二乘、Logistic回归等方法进行建模，考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数，使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]

蜡笔小新 2023-12-09 10:22:15
text
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
数组
深度学习黑话

OCR：用字符识别方法将形状翻译成计算机文字的过程Matlab：商业数学软件；CUDA：CUDA™是一种由NVIDIA推 ... [详细]

蜡笔小新 2023-10-17 17:55:01

小哥

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章